پریسا محمدیان کلخوران؛ محمد بحرانی
چکیده
هدف این پژوهش آن است که عملکرد چند روش یادگیری ماشین را در دستهبندی اشعار فارسی به دو گروه تلمیحدار و بدون تلمیح، بررسی کند. برای این کار از روشهای نظارتشده بیز ساده، ماشین بردار پشتیبان، درخت تصمیم، جنگل تصادفی، k نزدیکترین همسایه، رگرسیون لجستیک و الگوریتم پرسپترون چندلایه استفاده میشود. پس از جمعآوری دادههای برچسبخورده ...
بیشتر
هدف این پژوهش آن است که عملکرد چند روش یادگیری ماشین را در دستهبندی اشعار فارسی به دو گروه تلمیحدار و بدون تلمیح، بررسی کند. برای این کار از روشهای نظارتشده بیز ساده، ماشین بردار پشتیبان، درخت تصمیم، جنگل تصادفی، k نزدیکترین همسایه، رگرسیون لجستیک و الگوریتم پرسپترون چندلایه استفاده میشود. پس از جمعآوری دادههای برچسبخورده در قالب دو فایل متنی، هر کدام از ابیات به بردار عددی تبدیل میشوند و پس از ادغام دادهها و تقسیم آنها به دو دسته آموزش و آزمون، الگوریتم مدنظر بر روی دادههای آموزشی پیادهسازی و بر روی دادههای آزمون، آزمایش میگردد تا دقت عملکرد الگوریتم سنجیده شود. خروجی هر الگوریتم، برچسب پیشبینی شده توسط ماشین برای ابیات موردنظر است. شیوه ارزیابی الگوریتمها نیز روش LOOCV میباشد. نتایج ارزیابی نشان میدهد که الگوریتمهای بیز ساده با 76.09%، رگرسیون لجستیک با 76.09%، پرسپترون چند لایه با 75.22% و ماشین بردار پشتیبان با 74.35% نسبت به الگوریتمهای دیگر عملکرد بهتری دارند. در مجموع و با توجه به سایر معیارها از جمله معیار اف-1 و زمان اجرا، میتوان گفت که بهترین عملکرد مربوط به الگوریتم بیز ساده است.